情感分类特征选择方法研究

情感分类特征选择方法研究

作者:师大云端图书馆 时间:2021-06-30 分类:参考文献 喜欢:1323
师大云端图书馆

【摘要】近几年来,为了处理网络中大量带情感的文本信息,情感分析技术受到了广大研究者的广泛关注。情感分析技术旨在利用自然语言处理技术从文本中挖掘有关情感的重要信息。然而,情感分析和其他文本分类一样面临着高维度特征空间问题,该问题在造成特征冗余的同时也使得一些有效的学习算法难以施展。因此,情感分类中的特征选择方法研究具有重要的理论研究意义和实用价值。本文主要针对情感分类中的特征选择方法开展了以下几方面的研究工作:首先,本文针对情感分类中数据不平衡分布问题,提出了三种不同的基于欠采样方法的特征选择模式,并比较了四种经典的特征选择方法在这些模式中的分类性能。实验结果表明,特征选择方法可有效解决不平衡数据情感分类任务中的高维度特征空间问题。其次,本文提出了基于二部图的半监督情感分类特征选择方法。借助二部图模型和标签传播算法来计算每个特征的情感概率,通过对特征的情感概率进行排序实现特征选择。多个领域的实验结果表明,基于二部图的特征选择方法明显优于随机特征选择,在半监督情感分类任务中能够有效降低特征空间维度。最后,本文提出了一种面向跨语言情感分类的特征选择方法,用于解决双语情感分类任务中因特征扩展而导致的高维度特征空间问题。其核心思想是利用信息增益(IG)方法挑选出标注样本与未标注样本中的区分度较高的共有特征,接着借助选择出的种子特征,利用点互信息(PMI)获取未标注样本中的其他独有特征。实验结果表明,本文方法有效解决了双语半监督情感分类任务中特征空间较高的问题。
【作者】王志昊;
【导师】李培峰;李寿山;
【作者基本信息】苏州大学,计算机应用技术,2014,硕士
【关键词】情感分类;特征选择;半监督学习;不平衡分类;双语自然语言处理;

【参考文献】
[1]宋立顺.李觏土地制度改革思想研究[D].吉林大学,政治学理论,2014,硕士.
[2]殷家琪.基于虚拟机的快速故障恢复技术的研究[D].哈尔滨工业大学,计算机科学与技术,2013,硕士.
[3]蒋灵冬.高强度聚焦超声控制热敏硅质体内药物释放的研究[D].哈尔滨工业大学,生物医学工程,2014,硕士.
[4]杨涛,李龙澍.基于时间序列相似搜索和粗糙集的数据挖掘研究[J].微机发展,2005,05:116-118+154.
[5]张睿杰.巴塞罗那小型城市公共空间研究[D].浙江大学,建筑设计及其理论,2013,硕士.
[6]胡雨濛.基于亲子网络的创新扩散:大学生与父母微博认知采纳的实证研究[D].浙江大学,新闻与传播,2013,硕士.
[7]张春艳.美好人性的召唤[D].吉林大学,比较文学与世界文学,2004,硕士.
[8]曾智.关于玻色凝聚问题的特征值计算[D].湖南师范大学,计算数学,2013,硕士.
[9]孔铭铭.交通运输信息报送平台系统的设计与实现[D].吉林大学,软件工程,2014,硕士.
[10]马竹梧.1400mm宽幅12辊双机架可逆式冷轧机通过鉴定[J].冶金自动化,2006,03:66.
[11]赵文超.山西省人身保险市场存在问题及发展对策研究[D].山西财经大学,金融学,2013,硕士.
[12]唐法艳.我国社会保障制度问题研究[D].首都经济贸易大学,财政学,2014,硕士.
[13]王斌.浅析数据挖掘的主要方法和研究方向[J].计算机仿真,2005,10:8-10.
[14]马晶.电机转子槽用Fe-Cu合金的制备及组织与性能表征[D].哈尔滨理工大学,材料学,2012,硕士.
[15]余洁娜.Banach空间中闭线性算子广义逆的扰动定理[D].扬州大学,应用数学,2012,硕士.
[16]蒋典阳.教师参与学校决策的现状与对策研究[D].东北师范大学,教育经济与管理,2012,硕士.
[17]寇文丽.磨盘柿软化调控机制及应用技术研究[D].大连工业大学,农产品加工及贮藏工程,2012,硕士.
[18]耿涵,易晓.标识的开放性趋向──费城艺术博物馆的视觉形象系统分析[J].装饰,2015,01:118-119.
[19]沈卿.论醉酒驾驶犯罪的若干问题[D].华东政法大学,法律(专业学位),2012,硕士.
[20]王南.我国行政刑法的立法发展[D].中南民族大学,法律(专业学位),2013,硕士.
[21]刘晓菲.纳米结构碳膜场发射性能的研究[D].上海理工大学,2012.
[22]别毅兵.不同改良措施对烟区土壤及烤烟质量的影响[D].湖南农业大学,作物,2012,硕士.
[23]周晓燕.鄂东南赣西北地区周代遗存的初步研究[D].安徽大学,考古学及博物馆学,2013,硕士.
[24]张雪峰.大型真空调试平台的结构设计及低温特性分析[D].哈尔滨工业大学,机械制造及其自动化,2013,硕士.
[25]吴佩.地理“五环十步”教学模式的理论与实践研究[D].河北师范大学,学科教学,2014,硕士.
[26]瞿婕妤.跨文化背景下我国外资企业绩效管理过程的完善[D].湖南师范大学,企业管理,2013,硕士.
[27]陈勇.飞艇骨架结构拓扑优化研究[D].哈尔滨工业大学,防灾减灾工程及防护工程,2013,硕士.
[28]李朝明.复合同轴全息透镜的研究[D].苏州大学,光学工程,2003,硕士.
[29]王路.山区公路边坡病害处治技术及方案决策研究[D].重庆交通大学,道路与铁道工程,2012,硕士.
[30]吴小奇,黄士鹏,廖凤蓉,李振生.四川盆地须家河组及侏罗系煤成气碳同位素组成[J].石油勘探与开发,2011,04:418-427.
[31]王茜.基于随机计算的高性能DCT算法研究[D].西南大学,计算机应用技术,2013,硕士.
[32]冯宏佳,李健,耿延松.大功率交流调速系统在某舰炮上的应用[J].一重技术.2002(Z1)
[33]岳立云.高危乳腺癌患者的中医体质特点及个体化治疗探讨[D].北京中医药大学,中西医结合临床,2014,硕士.
[34]何其恩.XBRL财务报告的相关审计研究[D].兰州理工大学,会计学,2012,硕士.
[35]康彦彦.我国货币政策利率传导效应研究[D].青岛大学,金融学,2004,硕士.
[36]陈书昆.民办学校的性质及其制度安排[D].华南师范大学,教育学原理,2004,硕士.
[37]张弓.合肥膨胀土干湿循环作用下裂隙性及其改性研究[D].合肥工业大学,地质工程(专业学位),2014,硕士.
[38]邹传民.基于Cortex-M4的嵌入式光学相干层析成像系统的研究[D].广东工业大学,检测技术与自动化装置,2013,硕士.
[39]杨曦.论医疗过错的认定[D].西南政法大学,民商法学,2012,硕士.
[40]闵海.基于区域型水平集方法的图像分割算法研究[D].中国科学技术大学,模式识别与智能系统,2014,博士.
[41]赵学明.论王统照的文学创作与酒[D].吉林大学,中国现当代文学,2014,硕士.
[42]屈小波,闫敬文,肖弘智,朱自谦.非降采样Contourlet域内空间频率激励的PCNN图像融合算法(英文)[J].自动化学报,2008,12:1508-1514.
[43]王印通.基于WEBGIS的城市供热管网信息管理系统[D].南京理工大学,控制理论与控制工程,2013,硕士.
[44]安金龙,王正欧.一种适合于增量学习的支持向量机的快速循环算法[J].计算机应用,2003,10:12-14+17.
[45]胡轩昂.浙江省某高校建筑能耗评价指标及其能耗分析研究[D].浙江大学,2014.
[46]汤莉.新生代农民工消费特征及其影响因素分析[D].西南大学,农业经济管理,2014,硕士.
[47]何应.热浸镀Zn-Al-RE合金镀层的制备和性能研究[D].陕西理工学院,材料加工工程,2014,硕士.
[48]刘爽.集疏运环境下煤炭港口网络优化及运营策略研究[D].华北电力大学,技术经济及管理,2014,博士.
[49]杨玉环.论大学生公民意识的教育和培养[D].华东师范大学,马克思主义理论与思想政治教育,2002,硕士.
[50]李巍.基于FPGA的防盗报警器的设计与研究[D].吉林大学,软件工程,2012,硕士.

相关推荐
更多